Consulta de Guías Docentes



Academic Year/course: 2018/19

534 - Master's Degree in Informatics Engineering

62225 - Management of Large-Scale Data


Syllabus Information

Academic Year:
2018/19
Subject:
62225 - Management of Large-Scale Data
Faculty / School:
110 - Escuela de Ingeniería y Arquitectura
Degree:
534 - Master's Degree in Informatics Engineering
ECTS:
6.0
Year:
1
Semester:
Second semester
Subject Type:
Compulsory
Module:
---

4.1. Methodological overview

The methodology followed in this course is oriented towards achievement of the learning objectives. A wide range of teaching and learning tasks are implemented, such as classroom activities and autonomous work.

Classroom activities

  • Theory sessions. Teacher's presentation of the course contents, including illustrative examples.
  • Talks by experts. When possible, external experts to the university will explain some contents.
  • Seminars. Sessions based on oral or written contributions by the students.
  • Problem-based learning. Educative approach oriented towards a teaching and learning methodology where students tackle real problems in small groups under the supervision of a teacher.
  • Practice sessions. Any practical or collaborative activity done in class.
  • Laboratory sessions. Activities developed with specialized equipment (in labs, computer labs).
  • Tutorials. Students can review or discuss with the teacher the materials and topics presented in class.
  • Assessment. A set of written/oral tests, lab assignments, projects, other assignments, etc.

Autonomous work

  • Theoretical assignments. Preparing seminars, readings, research, assignments or write reports, etc. to be presented or submitted to the teacher in theory sessions.
  • Practical assignments. Preparing activities to be presented or submitted to the teacher in practice sessions.
  • Theoretical study. Study of contents related to the theory sessions: it includes any study activity not considered previously (study for exams, work in the library, complementary readings, solve problems and exercises, etc.).
  • Practical study. Related to the practice sessions.
  • Complementary activities. Formative activities related to the course, but not to the preparation of exams or included within the assessment activities: readings, seminars, videos, etc.

4.2. Learning tasks

The course (6 ECTS: 150 hours) includes the following learning tasks: 

  • Classroom activities (40 hours). Theory sessions, expert talks, seminars, problem-solving and cases, and lab assignments.
  • Practice and research assignments (80 hours).
  • Tutorials (5 hours).
  • Autonomous work and study (20 hours).
  • Assessment (5 hours). Exam and defense of the course project.

4.3. Syllabus

The course will address the following topics:

  1. Introduction and motivation to the problem of large volumes of data (Big Data).
  2. Storage of large amounts of data:
    • Data warehouses. Star schema design.
    • NoSQL databases.
  3. Management of large amounts of data:
    • Data distribution.
    • Information integration considering heterogeneous data sources.
    • Use of knowledge representation techniques (ontologies) to represent data sources and their access and integration.
    • Parallel processing techniques: MapReduce (Hadoop).
    • Data Stream Management Systems.
    • Other techniques: mobile agents.
  4. Interaction with large amounts of data:
    • Visualization techniques.
    • Design of appropriate user interfaces.
    • Usability.
  5. Analysis of large amounts of data:
    • Data mining.
    • Sentiment analysis.
    • Text mining.
  6. Use cases and applications, such as:
    • Data provided by sensors.
    • Unstructured data on the Web.
    • Recommendation Systems.
    • Analysis of blogs and social networks.
    • Smart cities.
    • Intelligent Transportation Systems.

4.4. Course planning and calendar

Further information concerning the timetable, classroom, office hours, assessment dates and other details regarding this course, will be provided on the first day of class or please refer to the Center website.

 


Curso Académico: 2018/19

534 - Máster Universitario en Ingeniería Informática

62225 - Manipulación y análisis de grandes volúmenes de datos


Información del Plan Docente

Año académico:
2018/19
Asignatura:
62225 - Manipulación y análisis de grandes volúmenes de datos
Centro académico:
110 - Escuela de Ingeniería y Arquitectura
Titulación:
534 - Máster Universitario en Ingeniería Informática
Créditos:
6.0
Curso:
1
Periodo de impartición:
Segundo semestre
Clase de asignatura:
Obligatoria
Módulo:
---

1.1. Objetivos de la asignatura

La asignatura y sus resultados previstos responden a los siguientes planteamientos y objetivos:

La asignatura estará centrada en la comprensión, el análisis y la evaluación de los siguientes contenidos:

  • Importancia de los datos y de su análisis en diferentes ámbitos de aplicación. Perspectiva del diseñador, usuario y analista.
  • Técnicas de interacción y visualización. Diseño centrado en el usuario. Evaluación de la usabilidad de aplicaciones y software. Aplicación al diseño de aplicaciones interactivas.
  • Modelos de almacenamiento y procesamiento de grandes volúmenes de datos.
  • Sistemas y metodologías para el análisis y manipulación de datos.

Con el desarrollo de la asignatura, y de conformidad con las competencias y resultados de aprendizaje esperados, se pretenden lograr los siguientes objetivos:

  • Que el alumno analice, dado un problema que implica grandes volúmenes de datos, los requisitos necesarios para su gestión (almacenamiento, transferencia, procesamiento, visualización e interacción).
  • Que el alumno desarrolle los elementos necesarios para integrar fuentes de datos heterogéneas, utilizando técnicas clásicas para la representación, tratamiento, análisis, visualización e interacción con repositorios de datos heterogéneos.
  • Que el alumno desarrolle una aplicación para un contexto dado, donde sea necesaria la gestión de grandes volúmenes de datos, y teniendo en cuenta criterios de escalabilidad, usabilidad y normativos.

1.2. Contexto y sentido de la asignatura en la titulación

En esta asignatura se realiza un recorrido por todos los aspectos que representan el reto introducido por los grandes volúmenes de datos, desde el diseño hasta la manipulación, procesado y análisis.

 

Los egresados de este máster son los profesionales capaces de liderar la implantación de sistemas de información que permitan conseguir este fin, así como auditar su adecuada implantación.

1.3. Recomendaciones para cursar la asignatura

El alumno que curse esta asignatura debería haber cursado asignaturas previas relacionadas con bases de datos y sistemas de información.

2.1. Competencias

Al superar la asignatura, el estudiante será más competente para...

Conseguir adquirir las siguientes competencias básicas y generales:

CG-01 - Capacidad para proyectar, calcular y diseñar productos, procesos e instalaciones en todos los ámbitos de la Ingeniería Informática.

CG-02 - Capacidad para la dirección de obras e instalaciones de sistemas informáticos, cumpliendo la normativa vigente y asegurando la calidad del servicio.

CG-05 - Capacidad para la elaboración, planificación estratégica, dirección, coordinación y gestión técnica y económica de proyectos en todos los ámbitos de la Ingeniería en Informática siguiendo criterios de calidad y medioambientales.

CG-09 - Capacidad para comprender y aplicar la responsabilidad ética, la legislación y la deontología profesional de la actividad de la profesión de Ingeniero en Informática.

CG-10 - Capacidad para aplicar los principios de la economía y de la gestión de recursos humanos y proyectos, así como la legislación, regulación y normalización de la informática.

CG-12 - Capacidad para aplicar e integrar sus conocimientos, la comprensión de estos, su fundamentación científica y sus capacidades de resolución de problemas en entornos nuevos y definidos de forma imprecisa, incluyendo contextos de carácter multidisciplinar tanto investigadores como profesionales altamente especializados.

CG-14 - Capacidad para predecir y controlar la evolución de situaciones complejas mediante el desarrollo de nuevas e innovadoras metodologías de trabajo adaptadas al ámbito científico/investigador, tecnológico o profesional concreto, en general multidisciplinar, en el que se desarrolle su actividad

CG-15 - Capacidad para transmitir de un modo claro y sin ambigüedades a un público especializado o no, resultados procedentes de la investigación científica y tecnológica o del ámbito de la innovación más avanzada, así como los fundamentos más relevantes sobre los que se sustentan.

CG-17 - Capacidad para asumir la responsabilidad de su propio desarrollo profesional y de su especialización en uno o más campos de estudio.

CB6 - Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación

CB7 - Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio

CB8 - Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios

CB9 - Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades

CB10 - Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.

 

Conseguir adquirir las siguientes competencias específicas:

CTI-02 - Capacidad para comprender y saber aplicar el funcionamiento y organización de Internet, las tecnologías y protocolos de redes de nueva generación, los modelos de componentes, software intermediario y servicios.

CTI-05 - Capacidad para analizar las necesidades de información que se plantean en un entorno y llevar a cabo en todas sus etapas el proceso de construcción de un sistema de información.

CTI-09 - Capacidad para aplicar métodos matemáticos, estadísticos y de inteligencia artificial para modelar, diseñar y desarrollar aplicaciones, servicios, sistemas inteligentes y sistemas basados en el conocimiento.

CTI-11 - Capacidad para conceptualizar, diseñar, desarrollar y evaluar la interacción persona-ordenador de productos, sistemas, aplicaciones y servicios informáticos.

 

 

2.2. Resultados de aprendizaje

El estudiante, para superar esta asignatura, deberá demostrar los siguientes resultados...

  1. Comprender y especificar los requisitos necesarios para la interacción, almacenamiento, transferencia y procesado de grandes volúmenes de datos.
  2. Conocer, comprender y aplicar las técnicas más comunes para la representación, tratamiento, análisis e interacción con repositorios de datos heterogéneos.
  3. Diseñar, desarrollar y evaluar una aplicación que facilite la elaboración y gestión de grandes volúmenes de datos, conforme a criterios de escalabilidad y normativa existente.

2.3. Importancia de los resultados de aprendizaje

El conjunto de los resultados de aprendizaje se puede resumir diciendo que el alumnado será capaz de diseñar soluciones para la gestión y el análisis de grandes volúmenes de datos en distintos escenarios, escogiendo entre las soluciones tecnológicas existentes de forma adecuada. Esto es de gran importancia hoy en día en el mundo laboral, ya que multitud de empresas privadas e instituciones públicas, así como otras entidades especializadas en ámbitos concretos, cuentan con grandes volúmenes de datos que necesitan gestionar. Términos como Big Data, Data Science, Data Analytics, Data Warehouses, Business Intelligence, y Data Mining, están cobrando especial importancia en los últimos años, dada la necesidad de profesionales en este ámbito.

3.1. Tipo de pruebas y su valor sobre la nota final y criterios de evaluación para cada prueba

El estudiante deberá demostrar que ha alcanzado los resultados de aprendizaje previstos mediante las siguientes actividades de evaluacion

  • Realización y presentación de trabajos. Estudio de un tema relacionado con la asignatura, elaboración de un informe sobre el mismo, y su presentación en clase. [20%]. Resultados de aprendizaje: 1, 2 y 3.
  • Proyecto. Un proyecto de grupo en el laboratorio, en el que se podrán en práctica los conocimientos y habilidades adquiridos en la asignatura. [50%]. Resultados de aprendizaje: 1, 2 y 3.
  • Prueba final escrita incluyendo preguntas de respuesta corta y de respuesta extensa. [30%]. Resultados de aprendizaje: 1, 2 y 3.

El estudiante que no opte por el procedimiento de evaluación descrito anteriormente, no supere dichas pruebas durante el periodo docente o que quisiera mejorar su calificación tendrá derecho a realizar una prueba global que será programada dentro del periodo de exámenes correspondiente a la primera o segunda convocatoria.

4.1. Presentación metodológica general

El proceso de aprendizaje que se ha diseñado para esta asignatura se basa en lo siguiente:

Las actividades de enseñanza y aprendizaje presenciales se basan en:

  1. Clase presencial. Exposición de contenidos mediante presentación o explicación por parte de un profesor (posiblemente incluyendo demostraciones).
  2. Charlas de expertos. Cuando sea posible, se contará con la exposición de contenidos mediante presentación o explicación por parte de un experto externo a la Universidad.
  3. Seminario. Período de instrucción basado en contribuciones orales o escritas de los estudiantes.
  4. Aprendizaje basado en problemas. Enfoque educativo orientado al aprendizaje y a la instrucción en el que los alumnos abordan problemas reales en pequeños grupos y bajo la supervisión de un tutor
  5. Clases prácticas. Cualquier tipo de actividad de carácter práctico o colaborativo en el aula.
  6. Laboratorio. Actividades desarrolladas en espacios especiales con equipamiento especializado (laboratorio, aulas informáticas).
  7. Tutoría. Período de instrucción realizado por un tutor con el objetivo de revisar y discutir los materiales y temas presentados en las clases.
  8. Evaluación. Conjunto de pruebas escritas, orales, prácticas, proyectos, trabajos, etc. utilizados en la evaluación del progreso del estudiante

 Las actividades de enseñanza y aprendizaje no presenciales se basan en:

  1. Trabajos teóricos. Preparación de seminarios, lecturas, investigaciones, trabajos, memorias, etc. para exponer o entregar en las clases teóricas.
  2. Trabajos prácticos. Preparación de actividades para exponer o entregar en las clases prácticas.
  3. Estudio teórico. Estudio de contenidos relacionados con las "clases teóricas": incluye cualquier actividad de estudio que no se haya computado en el apartado anterior (estudiar exámenes, trabajo en biblioteca, lecturas complementarias, hacer problemas y ejercicios, etc.).
  4. Estudio práctico. Relacionado con las "clases prácticas".
  5. Actividades complementarias. Son tutorías no académicas y actividades formativas voluntarias relacionadas con la asignatura, pero no con la preparación de exámenes o con la calificación: lecturas, seminarios, jornadas, vídeos, etc.

4.2. Actividades de aprendizaje

El programa que se ofrece al estudiante para ayudarle a lograr los resultados previstos comprende las siguientes actividades...

Trabajo del estudiante

 

La asignatura consta de 6 créditos ECTS que suponen una dedicación estimada por parte del alumno de 150 horas distribuidas del siguiente modo: 

  • Actividades presenciales: 40 h (Clase magistral, Resolución de problemas y casos, Prácticas de laboratorio, Prácticas especiales)

  • Realización de trabajos de aplicación o investigación prácticos: 80 h
  • Tutela personalizada profesor-alumno: 5 h
  • Estudio de teoría: 20 h
  • Pruebas de evaluación: 5 h

4.3. Programa

  • Introducción y motivación al problema de los grandes volúmenes de datos (Big Data).
  • Almacenamiento de grandes volúmenes de datos:
    • Almacenes de datos (data warehouses). Diseño en estrella.
    • Bases de datos NoSQL.
  • Gestión de grandes volúmenes de datos:
    • Distribución de los datos.
    • Integración de información con fuentes de datos heterogéneas.
    • Uso de técnicas de representación del conocimiento (ontologías) para la representación de fuentes de datos y su acceso e integración.
    • Técnicas de procesamiento paralelo: MapReduce (Hadoop).
    • Sistemas de gestión de flujos de datos (data streams).
    • Otras técnicas: agentes móviles.
  • Interacción con grandes volúmenes de datos:
    • Técnicas de visualización.
    • Diseño de interfaces de usuario apropiados.
    • Usabilidad.
  • Análisis de grandes volúmenes de datos:
    • Minería de datos.
    • Análisis del sentimiento.
    • Minería de textos.
  • Casos de uso y aplicaciones, tales como:
    • Datos provenientes de sensores.
    • Datos no estructurados en la Web.
    • Sistemas de recomendación.
    • Análisis de blogs y redes sociales.
    • Ciudades inteligentes (smart cities).
    • Sistemas de Transporte Inteligentes.

4.4. Planificación de las actividades de aprendizaje y calendario de fechas clave

El calendario de clases, prácticas y exámenes, así como las fechas de entrega de trabajos de evaluación, se anunciará con suficiente antelación, de acuerdo con las sesiones y fechas establecidas por el centro.